单碱基基因编辑系统的研究进展
来源:世界科技研究与发展
欢迎引用
刘佳慧,梁普平,时光,黄军就.单碱基基因编辑系统的研究进展[J].世界科技研究与发展, doi:10.16507/j.issn.1006-6055.2017.09.004.
刘佳慧 梁普平 时光(中山大学生命科学学院,基因工程教育部重点实验室)
黄军就(中山大学生命科学学院,基因工程教育部重点实验室;中山大学生命科学院和广州医科大学第三附属医院,广东省生殖医学重点实验室)
摘要:基因编辑技术是近年来取得突破性进展的颠覆性技术之一。CRISPR/Cas9基因编辑系统简便、高效,被广泛应用于基因功能研究和利用。尽管CRISPR/Cas9可以高效靶向目的基因,但其定点修饰依赖于效率低下的同源重组机制,因此精准编辑基因的能力有待提高。单碱基编辑技术(base editor,BE)通过将Cas9切口酶(Cas9 nikase, Cas9n)或无核酸酶活性的Cas9(nuclease dead Cas9, dCas9)与胞嘧啶脱氨酶形成融合蛋白,并通过sgRNA(单链向导RNA)将融合蛋白靶向靶位点,在不切割双链DNA的情况下对靶基因位点的单个碱基进行胞嘧啶C→胸腺嘧啶T或鸟嘌呤G→腺嘌呤A的精准编辑。目前,单碱基编辑技术已在植物、动物以及人细胞中进行了高效的基因定点突变,在农业、生物医学研究甚至基因治疗中有广泛的应用前景。本综述就单碱基编辑系统的发展和应用进行回顾和展望。
关键词:基因编辑;CRISPR/Cas9;单碱基编辑;胞嘧啶脱氨酶
中图分类号:Q812
文献标识码:A
doi:10.16507/j.issn.1006-6055.2017.09.004
1 引言
基因组编辑(简称为基因编辑)技术是利用人工核酸酶对基因组进行靶向修饰的遗传工程技术,是当今生命科学领域的研究热点。人工核酸酶主要包含锌指核酸酶(zinc finger nuclease, ZFN)、TALEN(transcription activator-like effector nucleases)核酸酶以及CRISPR/Cas9(clustered regularly interspersed short palindromic repeats)系统的Cas9酶,其中TALEN技术和CRISPR/Cas9技术分别在2012、2013和2015年被《科学》杂志评为十大科学突破之一。利用这些技术,人们可以根据自身研究的需求对感兴趣的基因进行敲除或过表达等操作,进而研究基因的功能和调控机制。CRISPR/Cas9基因编辑系统由于设计简便及高效的特点,已被广泛地运用到农业和生物医学研究。CRISPR/Cas9基因编辑系统虽然提高了基因敲除及定点修饰(包括定点突变及基因插入等)的效率,但是基于同源重组机制的基因定点突变效率仍然偏低。为了提高定点突变的效率,一项结合CRISPR/Cas9和胞嘧啶脱氨酶的单碱基编辑系统被相继报道。利用该系统可以在不产生双链DNA断裂的情况下,利用sgRNA将Cas9-胞嘧啶脱氨酶-尿嘧啶糖基化酶抑制子三者构成的融合蛋白靶向与gRNA(sgRNA中与目标DNA互补配对的序列)互补配对的靶位点,并将该靶位点的胞嘧啶(C)的氨基去除,从而使得C变成尿嘧啶(U),随着DNA的复制,U又会被胸腺嘧啶(T)替代,最终实现单碱基C→T的精确、高效突变。单碱基编辑技术为基因编辑技术的研究和应用增添了一种重要的工具。
2 CRISPR/Cas9系统
CRISPR/Cas9系统是存在于细菌和古细菌中的一种免疫防御机制,用来抵抗噬菌体以及外源DNA的入侵,基于CRISPR系统开发而来的基因编辑系统已经被广泛地运用于动物、植物和人细胞的基因编辑。CRISPR/Cas9基因编辑系统的核心是一个RNA-蛋白复合物,由能与基因组中靶DNA序列互补结合的sgRNA和Cas9核酸酶两部分组成。当该复合物与靶位点结合之后,会激活Cas9的核酸酶活性,从而切割靶DNA,产生双链断裂(DSB)的DNA损伤。DSB进一步激活细胞内的DNA损伤修复机制,主要包括易错的非同源末端连接(nonhomologous endjoining, NHEJ)以及高保真的同源重组修复(homologous recombination,HDR)。非同源末端连接的修复方式会在靶位点处产生DNA片段的插入或缺失(indels),导致移码突变,从而造成靶基因的功能丧失,成为无效等位基因(null allele)。当通过同源重组的方式进行修复时,需要内源的同源序列或者外源导入的同源序列作为修复模板,在靶位点处敲入外源片段或引入点突变。但是,在细胞中,同源重组的效率远远地低于非同源末端连接,导致靶位点处修复结果不可控,并倾向于产生核苷酸的插入和缺失。此外,利用该系统进行基因编辑可能会产生脱靶效应,在基因组非靶向位置诱发DSB,影响脱靶位点基因或附近基因的正常功能。
3 单碱基基因编辑系统的组成
基于CRISPR/Cas9基因编辑系统,2016年4月,哈佛大学生物化学家David Liu组率先在《自然》杂志上报告了一种新的基因编辑工具—单碱基编辑系统。同年,日本神户大学Akihiko Kondo组和我国上海交通大学的常兴组先后发表了类似的研究报告。单碱基编辑系统主要由sgRNA和融合蛋白两部分组成,其中融合蛋白一般由改造的Cas9蛋白、胞嘧啶脱氨酶和尿嘧啶糖基化酶抑制子三者构成,而常兴组的融合蛋白仅包含Cas9和胞嘧啶脱氨酶两部分。sgRNA通过与靶位点互补配对,引导融合蛋白结合到靶位点发挥作用。融合蛋白中的胞嘧啶脱氨酶能够使非互补链中相应的胞嘧啶C经脱氨基作用转变为尿嘧啶U,而DNA复制进一步使得U被T代替,而互补链上原来与C的互补碱基鸟嘌呤G将会变成腺嘌呤A,而尿嘧啶糖基化酶抑制子则能够抑制U的切除,最终实现非互补链上的C替换为T和互补链上G替换为A的精确编辑。
根据融合蛋白中Cas9蛋白突变体的不同,可以将该系统分为两类,一类是选用了无核酸内切酶活性的dCas9,选用这种蛋白的单碱基编辑系统进行编辑时不会造成切割靶DNA;另一类是选用了有单链DNA切口酶活性的Cas9n,选用这种蛋白的单碱基编辑系统进行编辑时会在靶基因位点的一条DNA单链产生切口,再以互补链为模板进行合成修复。由于Cas9n和dCas9仍保持与sgRNA结合的能力,但均不会引起双链DNA的断裂,从而抑制了由NHEJ介导的DNA片段的插入或缺失的发生。
目前该系统中常用到的胞嘧啶脱氨酶为大鼠的APOBEC1(apolipoprotein B mRNA-editing enzyme catalytic polypeptide-likeprotein)、七鳃鳗(sea lamprey)来源的激活诱导性胞嘧啶脱氨酶(activation-induced cytidinedeaminase, AID)类似物(PmCDA1)及人源的AID(hAID)。David Liu组首先比较了四种胞嘧啶核苷脱氨酶的效率,发现rAPOBEC1效率最高。利用rAPOBEC1酶,他们系统地研发了第一代单碱基编辑系统rAPOBEC1-XTEN-dCas9(baseeditor 1,BE1)。David R Liu组在此基础上开发了第二代和第三代单碱基编辑系统rAPOBEC-XTEN-dCas9-UGI (BE2)和rAPOBEC-XTEN-Cas9n-UGI(BE3)。而Akihiko Kondo组也单独开发了dCas9-PmCDA1-UGI和Cas9n-PmCDA1-UGI系统,常兴组则开发了基于人源AID和dCas9的dCas9-AIDx碱基编辑系统。
单碱基编辑系统只能将在胞嘧啶核苷脱氨酶活性位点附近的C脱氨基,这个区域称为活性窗口。通常胞嘧啶脱氨酶rAPOBEC1的活性窗口为5个核苷酸,为距离PAM最远端数起的第4-8位核苷酸,这样的话就会使活性窗口中的非靶向的碱基也会发生替换作用。David R Liu试图通过三种方式来缩短活性窗口,提高基因编辑的精准性。首先,将APOBEC1和Cas9之间的连接蛋白从XTEN换成不同数量的GGS重复序列,他们发现这样并不能够缩小单碱基编辑系统的活性窗口。其次,使用15 nt到20 nt长度不等的gRNA也没有得到稳定地缩短活性窗口的效果,而使用长度更短的gRNA会使得单碱基编辑系统的活性明显降低。最后发现通过对胞嘧啶脱氨酶进行突变,可以降低酶的活性、改变底物的结合、底物的构象,或者直接降低底物进入胞嘧啶脱氨酶活性区域的能力,从而缩小单碱基编辑系统的活性窗口。他们针对大鼠rAPOBEC1重要的催化位点W90分别做了3种突变(W90A、W90Y和W90F),结果发现W90突变成A后,该系统失去了催化活性,而突变成Y或F,只是轻微地降低了编辑活性,但是却可以缩小活性窗口,精准地编辑2-3个胞嘧啶核苷。他们后来又对rAPOBEC1的催化位点R126跟R132分别做了突变,发现R126E和R132A突变同样可以将活性窗口缩小为3个胞嘧啶核苷。同时针对脱氨酶的结合位点和催化位点做W90Y、W126E和W132E的3个位点突变,结果显示在平均编辑效率只降低了2.9倍的情况下可以将编辑活性窗口精确到1个胞嘧啶核苷,提高了编辑的精准性。
4 单碱基基因编辑系统的应用
4.1 单碱基基因编辑系统在人类疾病治疗方面的应用
来自上海交通大学的常兴课题组率先开发了dCas9-AIDx碱基编辑系统,并将其应用到肿瘤研究中。在肿瘤疾病治疗过程中,基因上特定位点的碱基突变会使部分肿瘤细胞对抗肿瘤药物产生耐药性,如在慢性髓系白血病(chronic myloid leukemia, CML)患者的治疗中,常使用伊马替尼药物抑制癌细胞中BCR-ABL激酶的活性,从而抑制白细胞的过度增殖。但是,在治疗过程中,癌细胞会通过特定基因序列点突变(如常见的T315I突变)后产生耐药性,这也是目前肿瘤治疗的一大障碍。针对这个问题,常兴课题组在CML患者来源的K562细胞系中表达了dCas9-hAIDx的融合蛋白,由于没有使用UGI,因此AIDx修饰的胞嘧啶C及互补的鸟嘌呤A可以随机地向其它三种碱基转变。他们使用sgRNA文库将dCas9-AIDx靶向到ABL基因的第6个外显子,诱导点突变的发生。通过用伊马替尼药物筛选,将伊马替尼耐药的细胞与筛选前细胞的ABL的第6个外显子进行深度测序分析,发现了10个与伊马替尼耐药相关的基因突变位点,包括了在临床中已被证实的T315I突变。该研究证明,可以利用此系统筛选肿瘤细胞产生耐药性的突变,探究肿瘤疾病的耐药机制,开创了筛选肿瘤耐药突变的新方法,结合第二代测序技术在临床中的应用,将有助于癌症病人耐药的早期发现,提高癌症病人的生存率。
4.2 单碱基基因编辑系统在动物模型方面的应用
目前,大多数关于单碱基编辑系统的研究报告主要基于细胞实验,而其在动物模型开发中的应用将有利于研究人员深入研究疾病发生和发展的机理。韩国首尔大学Jin-Soo Kim组率先发表了他们将rAPOBEC-XTEN-Cas9n-UGI(BE3)系统运用于小鼠疾病模型制备的研究成果。针对小鼠的抗肌萎缩蛋白基因Dmd以及酪氨酸酶基因Tyr,分别设计了特异识别的sgRNA,通过显微注射sgRNA和rAPOBEC1-XTEN-Cas9n-UGI融合蛋白的mRNA或者电转染sgRNA和rAPOBEC1-Cas9n-UGI蛋白的复合物的到小鼠受精卵。在所获得的9只Dmd的F0代小鼠中,有5只小鼠是产生了靶位点的碱基突变,包括一只纯合子突变小鼠(CAG>TAG)。进一步通过免疫染色发现,这只纯合子Dmd突变小鼠几乎检测不到该蛋白的表达。而通过电转染gRNA和rAPOBEC-XTEN-Cas9n-UGI融合蛋白的复合物,产生了7只Tyr F0后代小鼠中均检测到靶基因突变,包括3只纯合子Tyr突变小鼠。同时,Jin-Soo Kim等还在子代小鼠中发现了部分小鼠的靶位点发生了碱基删除。
同一时间,中山大学黄军就课题组也利用单碱基编辑系统研究了该技术在制备小鼠疾病模型中的效率。与Jin-Soo Kim团队不同,他们利用保真性更高、且无核酸酶活性的Cas9突变体dCas9-HF2(D10A/N497A/R661A/H840A/Q926A/D1135E)来构建融合蛋白rAPOBEC1-XTEN-dCas9-HF2-UGI(HF2-BE2)从而避免了Cas9n对靶DNA的切割,降低碱基编辑系统的脱靶效应。针对Tyr基因,该课题组设计了2条sgRNA,分别与rAPOBEC1-XTEN-dCas9-HF2-UGI的mRNA注射到小鼠受精卵中。通过检测胚胎的基因型,发现HF2-BE2在碱基编辑的效率可以高达50%(22/44),并产生1个纯合的突变胚胎。将注射后的胚胎移植到假孕鼠中,他们发现两条sgRNA产生突变F0代小鼠的效率分别为18.2%(2/13)和63.6%(7/11),其中有4只F0代小鼠的皮毛出现黑白嵌合现象,另外还有1只小鼠皮毛完全白化,从而在分子水平及表型上证明了HF2-BE2系统能高效编辑靶基因,并获得无嵌合现象的后代。与Jin-Soo Kim的发现类似,黄军就课题组也发现了碱基编辑系统会在胚胎中产生碱基的缺失,并首次报道了在小鼠胚胎中由碱基编辑系统诱导产生的靶位点处的碱基插入以及临近位点的脱氨基。由于所用的dCas9-HF2不具有核酸酶活性,他们认为,碱基的插入和缺失是由于胞嘧啶脱氨基后产生的U被碱基切除修复机制识别,并被切除从而产生无碱基位点,无碱基位点再进一步转化成DNA双链损伤,从而导致碱基插入和缺失的产生。
以上两项研究结果充分地证明了单碱基编辑系统能高效地用于制备疾病动物模型,但仍需进一步优化来提高特异性及降低碱基插入和缺失的产生。
4.3 单碱基基因编辑系统在植物方面的应用
转基因技术在改良作物性状方面已经做了大量的工作,但由于外源基因的导入和公众科普的缺乏,使得转基因作物的推广和应用存在较大的难度。作物在漫长的人工选育过程中,人类通过人工选择的方式定向选育具有优良性状的基因突变株,但该过程耗时、耗力且不可控。利用同源重组技术,可以获得定点修饰的优良植物株,但由于同源重组的效率太低,因此可行性不高。单碱基编辑技术在人细胞中高效编辑单个碱基的结果,提示可以通过该系统在农作物中的进行定点可控的基因编辑,进而快速、高效地获得优良性状的植株。
中科院的高彩霞团队率先成功地将单碱基编辑技术运用到三大重要农作物小麦,水稻和玉米的性状改良上,并且取得了国际瞩目的影响。她们构建了密码子优化的rAPOBEC1-XTEN-dCas9n-UGI和rAPOBEC1-XTEN-dCas9-UGI两种融合蛋白,通过针对三大农作物共7个基因位点进行单碱基编辑实验,结果发现选用Cas9n可以获得较高的单碱基编辑效率。研究还发现在作物中胞嘧啶核苷脱氨酶的作用活性窗口为7个核苷酸序列,从距离PAM最远端数起的第3到第9位核苷酸,这相对于在动物细胞中的编辑窗口更广。她们还尝试采用土壤杆菌为载体,携带Cas9n-XTEN-rAPOBEC1-UGI融合蛋白和sgRNA,编辑水稻内一种衰老控制基因OsCDC48。研究结果显示单碱基编辑效率在5.0%-32.5%,靶位点处没有发现核苷酸序列的随机插入或缺失,而且预测可能的脱靶位点处也没有发现突变。同一时间,中科院上海生命科学研究院的朱健康团队和中国农业科学院作物研究所的夏兰琴团队也分别报道了运用单碱基编辑系统对水稻基因进行单碱基编辑。这三个独立的研究表明,单碱基编辑系统可以在农作物中取得高效的编辑效率,为改良作物品种带来新希望。
最近,美国农业部官方宣布基因编辑的部分玉米、土豆和黄豆新种是非转基因产品,不受转基因法规监管。因此,我国需要加大对基因编辑技术育种的支持力度,这将会使我国在育种领域获得国际领先的地位。
5 单碱基基因编辑系统目前仍存在的问题
单碱基编辑系统能够在不引起双链DNA断裂的情况下,由gRNA靶向到靶位点,利用胞嘧啶核苷脱氨酶进行碱基编辑,是新一代基因编辑工具。目前该系统仍然存在一定的缺陷。
第一、由于酶功能的限制,目前单碱基编辑系统只能实现单个碱基C→T或G→A的编辑,限制了碱基编辑系统的应用。
第二、受到PAM识别区域的限制,单碱基基因编辑的靶向范围有限。可以利用SaCas9、Cpf1等核酸酶及其突变体替代SpCas9可以进一步拓展单碱基编辑系统的识别靶点范围。
第三、单碱基编辑系统仍然会导致靶位点产生极少量DNA序列插入或缺失。虽然目前的单碱基编辑系统均不能切割靶DNA的双链,但Jin-Soo Kim组利用Cas9n蛋白介导胚胎的单碱基编辑时发现靶DNA位点会产生随机20bp 的缺失。高彩霞团队在编辑农作物的报告中同样使用了Cas9n,也发现了0.01%~0.22%的插入缺失(indels)突变。Jin-Soo Kim组推测这些indels的产生是由于Cas9n切割单链DNA引发的。黄军就团队为了避免单链DNA切割,使用了dCas9-HF2酶介导单碱基编辑,但其结果仍然发现靶位点存在少量的indels。因此如何避免或降低indels的发生仍需进一步的研究。
第四、单碱基编辑系统的活性窗口仍然较大。目前研究结果表明,在针对靶基因位点进行编辑时会导致临近的C碱基也发生突变。此外,单碱基编辑系统中胞嘧啶核苷脱氨酶本身就具有结合DNA进行脱氨基的作用,如AID酶会倾向结合WRC(W=A/T,R=A/G)序列,可能会在细胞中引起脱靶效应。已有的研究显示,定位在细胞核内的APOBEC3B酶的过高表达可以作为细胞发生癌变的指标之一,暗示着导入大量外源的胞嘧啶核苷脱氨酶可能会存在一定的安全隐患。
第五,单碱基编辑系统的脱靶效应。Jin-SooKim开发了Digenome-Seq.技术,在体外比较了靶向EMX1和HBB的单碱基BE3编辑系统和Cas9酶的特异性,发现BE3单碱基编辑系统的脱靶位点远远少于Cas9酶,但在细胞内的实验还是发现单碱基编辑系统存在脱靶效应。最近,David R Liu团队通过用利用具有更高特异性的Cas9n-HF1(D10A/N497A/R661A/Q926A/D1135E)替代野生型的Cas9n开发了HF1-BE3单碱基编辑系统。他们发现Cas9n-HF1能提高单碱基编辑系统的特异性。有意思的是在Cas9-HF1酶不切割的位点,Cas9n-HF1-BE3仍然有脱靶效应,说明Cas9n-HF1-BE3的特异性有可能比Cas9-HF1酶差。
6 总结与展望
单碱基编辑系统自出现以来,被证明了可以在人细胞、动物和植物中进行高效的单碱基编辑。尽管目前该系统还存在一些缺陷,但通过优化可以提高其效率、特异性和安全性。比如通过对胞嘧啶核苷脱氨酶的突变优化,有望在保持它催化活性的情况下缩短它的活性窗口,从而使编辑更加精准。另外还可以通过在sgRNA的5’端加上GG序列,或者通过用蛋白或者mRNA来替代表达载体,都可以降低碱基编辑系统的浓度及作用时间,提高剪辑编辑系统的特异性。针对高浓度的胞嘧啶脱氨酶导入细胞核可能会产生非靶向突变的安全隐患,可以将胞嘧啶核苷脱氨酶分割到两个载体中表达,只有当两部分都由sgRNAs引导到靶位点才能二聚化形成具有活性的胞嘧啶脱氨酶,从而降低脱靶的风险。总而言之,单基因编辑技术已经在人疾病研究、人类疾病相关动物模型制备、动物和植物育种等方面显现出巨大的潜力,该技术的进步将推动我国及全世界在生命科学研究、农业生产和生物医药等领域的快速发展。
相关文章推荐: